| |
description |
116 pages
|
|
In den letzten Jahren ist die täglich anfallenden Menge an Daten
kontinuierlich gestiegen. Hieraus entstand das Problem, dass das
Informationsangebot für das Unternehmensmanagement zunimmt, und
dessen Versorgung mit den entscheidungsrelevanten Daten zunehmend
erschwert wird.
Neben OLAP hat sich als eine weitere Möglichkeit Informationen aus
diesen großen Datenmenge zu extrahieren, das "Data
Mining" entwickelt. Diese Arbeit beschäftigt sich zunächst
mit den Grundlagen des Data Mining, insbesondere mit dem
Mining-Ablauf und den unterschiedlichen Mining-Algorithmen. Daneben
wird die Vorgehensweise zur Implementierung einer
Data-Mining-Anwendung mit Hilfe des "Intelligent Miner for
Data" von IBM auf bestehenden Daten betrachtet. Hierzu wird die
Datenbasis des TPC-H-Benchmarks verwendet.
Weiterer Schwerpunkt dieser Arbeit ist die Untersuchung
unterschiedlicher Optimierungsmöglichkeiten auf Datenbankseite zur
Beschleunigung der Analyselaufzeiten. Hierzu wird der Einfluß von
Implementierungsaspekten, wie die Verwendung von Views,
materialisierten Tabellen oder Summary Tables betrachtet.
Zusätzlich wird auch auf die Auswirkungen der Attributanzahl der zu
analysierenden Relationen eingegangen. Als ein weiterer Punkt wird
die Verwendung von Indizes untersucht.
Der Abschluß dieser Arbeit vergleicht die Laufzeiten der zuvor
identifizierten Optimierungsansätze.
|
publisher |
Stuttgart, Germany, Universität Stuttgart
|
type |
Text
|
| Student Thesis
|
source |
ftp://ftp.informatik.uni-stuttgart.de/pub/library/medoc.ustuttgart_fi/STUD-1805/STUD-1805.ps
|
contributor |
Anwendersoftware (IPVR)
|
format |
application/postscript
|
| 13605899 Bytes
|
subject |
Database Applications (CR H.2.8)
|
| Information Search and Retrieval (CR H.3.3)
|
| Information Storage and Retrieval Systems and Software (CR
H.3.4)
|
| Information Systems Applications Types of Systems (CR
H.4.2)
|
relation |
Student Thesis No. 1805
|